Міністерство освіти і науки України
Національний університет «Львівська політехніка»
кафедра ІСМ
Звіт
До лабораторної роботи № 1 на тему:
«Основні принципи оцифрування та перетворення тексту з твердих носіїв в електронний вигляд за допомогою системи оптичного розпізнавання
символів Fine Reader»
З курсу «Комп'ютерні системи обробки текстової та графічної інформації»
Підготував:
Перевірив Андруник В.А
Львів 2017
Мета роботи – Ознайомитися та на практиці засвоїти основні принципи введення (оцифрування) та перетворення текстової інформації з твердого носія в електронний вигляд з допомогою системи оптичного розпізнавання символів Fine Reader. Провести загальне ознайомлення з пакетами мовного розпізнавання тексту та підготувати отримані матеріали для публікації (на прикладі Вісника каф. ІСМ), виконавши аналіз певної предметної області.
Хід роботи
Обрана предметна область – математичне моделювання в інформатиці.
Виконуючи дослідження за даною темою, знаходжу потрібну інформацію у друкованих вісниках чи науково-метричних журналах і оцифровую її за допомогою компактної камери. Для цього кладу книжку, розгорнуту на сторінці 224, на рівний стіл у добре та рівномірно освітленій кімнаті. Використовую камеру телефону Lenovo A536 із автоматичними налаштуваннями та вимкнутим спалахом. Пристрій розташовую над сторінкою, паралельно і по центру, на такій відстані, що дозволяє захопити увесь аркуш, тобто приблизно 20 см. Вручну фокусую зображення на центрі сторінки, фотографую кілька разів. Обираю найякісніше та найчіткіше фото і за допомогою хмарного сервісу OneDrive завантажую зображення на ПК.
/
Рисунок 1. Оцифрована сторінка 223
Ознайомлююся з класифікацією сканерів. Розрізняють 4 види сканувальних пристроїв: ручний, планшетний, барабанний і 3D. Ручний сканер – це портативний пристрій, який дозволяє зчитувати зображення вибірково і являє собою пристрій, який працює завдяки пересуванню людиною зображення (300 до 800 крапок на дюйм). Наприклад, це сканер штрих-кодів або QR-кодів.
У планшетних сканерах об’єкт розміщують на склі планшета сканованою поверхнею вниз. Під склом розташовується рухома лампа, її переміщення забезпечує кроковий електродвигун. Світло, відбите від об'єкта, через систему дзеркал потрапляє на лінійку спеціальних фотоприймачів. Значення вихідних напруг лінійки фотоприймачів через комутатор подають на аналогово-цифровий перетворювач (АЦП). Цифрові коди такого перетворення передаються у комп'ютер. За кожен крок двигуна сканується частинка об'єкта, що потім поєднується програмним забезпеченням драйвера сканера у загальне зображення.
Барабанний сканер – це пристрій, в основі якого лежить барабан, на якому закріплюється оригінал, що обертається зі значною швидкістю. Зчитувальний пристрій розташовується дуже близько до оригіналу, чим досягається високу якість сканування. Використовується в поліграфії.
3D сканер – це пристрій, який дозволяє виконувати зчитування тривимірних об’єктів і оцифровувати їх як тривимірні моделі, що характеризується високою точністю. 3D сканер може бути і ручним, і стаціонарним. Пристрій досліджує відстань до об’єкта у різних точках, залучаючи дві вбудовані камери і підсвітку, після чого програмне забезпечення аналізує отримані дані і на екран виводять готову цифрову модель. В більш сучасних різновидах, відстань вимірюють за допомогою лазерного променю, який рухається над поверхнею об’єкта і вимірюю відстань в різних координатних точках та передає дані на ПЗ. Такі пристрої активно застосовують у медицині, архітектурі, розважальній індустрії, будівництві, культурознавстві, кіно.
Рисунок 2. Схема роботи 3D сканера.
Робота з програмою Fine Reader.
Fine Reader – це омніфонтова система (система розпізнавання символів) оптичного розпізнавання текстів, фактично незалежно від того, якими шрифтами він оформлений. Особливістю програми FineReader є висока точність розпізнавання і мала чутливість до дефектів друку. Процес складається із трьох основних етапів: введення зображення (сканування чи вибір з біблі...